热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

竞赛报名|AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

也许用不了多久,人们就会看到全新的数据库交互方式。不一定是专业的SQL语言开发者,也不用局限于传统的条件筛选,交互很简单,说说话,就可以随心所欲的调用所需数据,甚至完成更复杂的“逻辑”式计算。更重要的,数据库开发和应用的舒适度都有望大大提升。这就是

也许用不了多久,人们就会看到全新的数据库交互方式。

不一定是专业的 SQL 语言开发者,也不用局限于传统的条件筛选,交互很简单,说说话,就可以随心所欲的调用所需数据,甚至完成更复杂的“逻辑”式计算。更重要的,数据库开发和应用的舒适度都有望大大提升。

这就是NL2SQL的魔力。

得益于人工智能和NLP的发展,用自然语言生成可执行的SQL语句,进而挖取数据价值,正成为新兴研究领域。6月3日,国内首届中文NL2SQL挑战赛正式上线启动。

大赛由国内领先的智能语义公司 追一科技 主办, 总奖金池16.5万 ,将发布 全球首个中文数据集 ,向海内外高校学生、研究机构、企业开发者开放,共同推进NLP在数据库交互上的创新研究与普惠应用。

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

打通人与结构化数据间的壁垒

在AI、区块链、IoT、AR等高新技术飞速发展的当下,数据库这一宝库似乎被遗忘在了角落。数据库存储了大量的个人或者企业的生产运营数据,每天都会和数据库产生或多或少的交互。

通常,如果想要查询数据库中的数据,需要通过像SQL这样的程序式查询语言来进行交互,这就需要懂SQL语言的专业技术人员来执行这一操作。

为了让非专业用户也可以按需查询数据库,当前流行的技术方案设计了基于条件筛选的专门界面,用户可以通过点选不同的条件来查询数据库,比如这个筛选汽车的界面。

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

然而,在这个界面上进行操作,极大地限定了数据库查询的使用场景和查询界限。同时,即使是对于精通数据库程序语言的专业人士,经常构思SQL语句、维护这样一个查询界面也是一项重复度较高的工作。

在CUI(Conversation User Interface)的大背景下, 如何通过自然语言自由地查询数据库中的目标数据成为了新兴的研究热点。

Natural Language to SQL( NL2SQL)就是这样的一项技术,可以将用户的自然语句转为可以执行的SQL语句。

此次比赛,也是中文研究领域首次举办NL2SQL相关比赛。

在海外,NL2SQL领域的研究,已经取得了一定成果,发布了WikiSQL、Spider、WikiTableQuestions、ATIS 等诸多公开数据集。一些数据集的准确度,已经达到了90%以上,但很大程度只是抛砖引玉,落地场景价值受限。高价值数据集,难度又令人望而生畏。

作为智能语义的领跑者,追一科技在智能交互上,拥有深厚的积累,包括在对话机器人、阅读理解、文本挖掘等,形成了大量前瞻研究与商业应用案例。对于数据库智能化交互,追一科技将率先发布首个中文NL2SQL数据集。

据了解,本届NL2SQL比赛目标是 利用NLP技术来解决数据库交互问题 ,让非技术背景用户可以通过自然语言的方式与数据库进行交互,打通人与结构化数据间的壁垒,更有效地利用结构化数据,实现人机交互体验升级。比赛过程中会涉及到结构化数据理解、语义理解、数据库交互等多方面的挑战。

首个NL2SQL中文数据集

追一科技将提供预处理好的有标签数据集及相应的数据库文件,以助力数据驱动型学习。参赛者需要在初赛阶段提交线下预测结果,复赛阶段提交线上预测代码及模型,在不可见的数据集上进行测试,按测试结果进行最终排名。

本次比赛的数据集包含有约4,500张表格、50,000条基于这些表格提出的自然语言问句,以及自然语言问句所对应的SQL语句。数据来源是通过爬取并解析公开数据源中存在的表格,内容则主要覆盖了金融领域及通用领域。

与现有的英文NL2SQL数据集不同的是,本次比赛的数据集包含了更口语化的表达、额外引入表格内容作为输入的一部分,这就要求选手不仅要结合自然语言问句与表结构来正确地预测SQL语句骨架,更需要思考何将自然语言语义与结构化的表格结构及表格内容有效地融合和理解,从而生成正确的SQL语句。

NL2SQL的未来

在行业研报、业绩报告、新闻公告、使用说明书等各种书面信息载体上,尤其是金融、快消等行业的各种报告,充斥着许多表格形式的结构化数据。而当用户去查询表格中的内容时,需要肉眼去从表格中去筛选满足条件的数据,准确率和效率都较低。

通过NL2SQL,用户在查询这些表格的内容时,可以直接通过自然语言与表格进行交互,并得到结果,用户体验会很自然。

“我们相信,随着NLP进入AI领域研究的焦点位置,越来越多场景将被解锁,并激发出创新的应用和商业模式。数据库的创新交互,将拥有巨大的潜力。”追一科技联合创始人兼CTO刘云峰表示,此次NL2SQL大赛,只是一个起点,追一科技作为智能语义领跑者,期待与更多NLP和AI开发者一起努力,不断探索NLP赋能新秘境。

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

  追一科技联合创始人兼CTO刘云峰

报名通道

进入下方网址,或点击阅读原文,进入报名页面:

https://tianchi.aliyun.com/markets/tianchi/zhuiyi

比赛日程

初赛:本地训练和预测,6月24日-8月6日

复赛:线上训练和预测,8月19日-9月9日

决赛:线下答辩和颁奖,10月(具体时间、地点待定)

奖项设置

总奖金池16.5万

一等奖8万(1支队伍)

二等奖5万(1支队伍)

三等奖2万(1支队伍)

优胜奖获价值7500元的数码产品(2支队伍)

获奖者均可获得追一科技校招offer直通卡,免简历筛选和笔试,直接进入技术面试。

大咖评审

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

毛可智

新加坡南洋理工大学副教授

新加坡南洋理工大学副教授,谢菲尔德大学博士。在机器学习、文本分析、自然语言处理和信息融合方面拥有20多年经验,发表了大约100篇科学论文。

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

俞扬

南京大学教授

俞扬博士,南京大学教授,中组部万人计划青年拔尖人才计划。主要研究领域为机器学习、强化学习。获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。发表论文40余篇,获得4项国际论文奖励和2项国际算法竞赛冠军,入选2018年IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘”青年成就奖”,受邀在IJCAI’18作关于强化学习的”青年亮点”报告。

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

漆桂林

东南大学教授

东南大学教授、博士生导师,东南大学认知智能研究所所长,英国贝尔法斯特女皇大学博士,发表高水平学术论文 150 余篇。

— 完 —

AI社群 | 与优秀的人交流

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

精选直播 | 大牛的观点碰撞

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战

量子位  QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧!


以上所述就是小编给大家介绍的《竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 我们 的支持!


推荐阅读
  • 如何在Java中使用DButils类
    这期内容当中小编将会给大家带来有关如何在Java中使用DButils类,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。D ... [详细]
  • 本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用,包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]
  • php更新数据库字段的函数是,php更新数据库字段的函数是 ... [详细]
  • 本文详细介绍了MySQL数据库的基础语法与核心操作,涵盖从基础概念到具体应用的多个方面。首先,文章从基础知识入手,逐步深入到创建和修改数据表的操作。接着,详细讲解了如何进行数据的插入、更新与删除。在查询部分,不仅介绍了DISTINCT和LIMIT的使用方法,还探讨了排序、过滤和通配符的应用。此外,文章还涵盖了计算字段以及多种函数的使用,包括文本处理、日期和时间处理及数值处理等。通过这些内容,读者可以全面掌握MySQL数据库的核心操作技巧。 ... [详细]
  • 本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先,按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库,用于存储时间序列数据;collectd 负责数据的采集与传输;Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接,便于用户参考和进一步了解其配置选项。通过本指南,读者可以轻松搭建一个高效的数据监控系统。 ... [详细]
  • MySQL Decimal 类型的最大值解析及其在数据处理中的应用艺术
    在关系型数据库中,表的设计与SQL语句的编写对性能的影响至关重要,甚至可占到90%以上。本文将重点探讨MySQL中Decimal类型的最大值及其在数据处理中的应用技巧,通过实例分析和优化建议,帮助读者深入理解并掌握这一重要知识点。 ... [详细]
  • 在使用 Cacti 进行监控时,发现已运行的转码机未产生流量,导致 Cacti 监控界面显示该转码机处于宕机状态。进一步检查 Cacti 日志,发现数据库中存在 SQL 查询失败的问题,错误代码为 145。此问题可能是由于数据库表损坏或索引失效所致,建议对相关表进行修复操作以恢复监控功能。 ... [详细]
  • 卓盟科技:动态资源加载技术的兼容性优化与升级 | Android 开发者案例分享
    随着游戏内容日益复杂,资源加载过程已不仅仅是简单的进度显示,而是连接玩家与开发者的桥梁。玩家对快速加载的需求越来越高,这意味着开发者需要不断优化和提升动态资源加载技术的兼容性和性能。卓盟科技通过一系列的技术创新,不仅提高了加载速度,还确保了不同设备和系统的兼容性,为用户提供更加流畅的游戏体验。 ... [详细]
  • com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]
  • 在多线程并发环境中,普通变量的操作往往是线程不安全的。本文通过一个简单的例子,展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]
  • 检查在所有可能的“?”替换中,给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]
  • 通过使用Sqoop导入工具,可以精确控制并高效地将表数据的特定子集导入到HDFS中。具体而言,可以通过在导入命令中添加WHERE子句来指定所需的数据范围,从而在数据库服务器上执行相应的SQL查询,并将查询结果高效地存储到HDFS中。这种方法不仅提高了数据导入的灵活性,还确保了数据的准确性和完整性。 ... [详细]
  • 在处理数据库中所有用户表的彻底清除时,目前尚未发现单一命令能够实现这一目标。因此,需要采用一种较为繁琐的方法来逐个删除相关表及其结构。具体操作可以通过编写PL/SQL脚本来实现,该脚本将动态生成并执行删除表的SQL语句。尽管这种方法相对复杂,但在缺乏更简便手段的情况下,仍是一种有效的解决方案。未来或许可以通过数据库管理工具或更高版本的数据库系统提供更简洁的处理方式。 ... [详细]
  • 在《Cocos2d-x学习笔记:基础概念解析与内存管理机制深入探讨》中,详细介绍了Cocos2d-x的基础概念,并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解,例如在处理鱼的运动过程中,可以通过编写自定义函数来动态计算角度变化,利用CallFunc回调机制实现高效的游戏逻辑控制。此外,文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏,为开发者提供了实用的编程技巧和最佳实践。 ... [详细]
  • Python错误重试让多少开发者头疼?高效解决方案出炉
    ### 优化后的摘要在处理 Python 开发中的错误重试问题时,许多开发者常常感到困扰。为了应对这一挑战,`tenacity` 库提供了一种高效的解决方案。首先,通过 `pip install tenacity` 安装该库。使用时,可以通过简单的规则配置重试策略。例如,可以设置多个重试条件,使用 `|`(或)和 `&`(与)操作符组合不同的参数,从而实现灵活的错误重试机制。此外,`tenacity` 还支持自定义等待时间、重试次数和异常处理,为开发者提供了强大的工具来提高代码的健壮性和可靠性。 ... [详细]
author-avatar
穿过a黑夜_440
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有